Language Model for Dialogue Applications
略 :
LaMDA
大規模言語モデル
(
大規模自然言語モデル
) を
対話
に応用したもの
MUM
(
Multitask Unified Model
) により、テキストに限らないマルチモーダル (画像や音声) な学習により、「夕日が綺麗な海岸のルート」 などの指示も可能
動画内のシーン検索をテキストで行うことが可能に
参考文献
DX 白書 2023